邮箱:econometrics666@126.com所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
林毅夫教授最经典AER论文被挑战, 新数据和方法: 断点中的差分, 交叠DID局部投影法, 机器学习。
两位加州大学伯克利的研究者在其最新一篇文章中,通过使用卫星影像数据和方法: 断点中的差分, 交叠DID局部投影法, 机器学习等,挑战了北大林毅夫教授被引量最高的AER论文(Lin (1992))的结论。
他们发现1978年家庭联产承包责任制(HRS)改革对我国农作物产量增长的影响近乎零效应,这直接挑战了林毅夫教授在AER文章中“取消集体化对农业总产出增长贡献了49%”的结论。
相反,在这两位学者的研究中,他们发现另一项改革,即1979年提高国家收购价格使其接近自由市场水平,可能是推动中国农业起飞的主要因素。
我们深入研究了中国经济奇迹中的一个核心变革,家庭联产承包责任制(HRS)。自1978年开始,这一制度取消了农业集体化。通常认为,家庭联产承包责任制极大地提升了农业生产力,但这个结论建立在不可靠的官方数据基础上。为了更清晰地了解情况,我们利用历史卫星影像获取了新的粮食产量测量数据,这些数据独立于中国官方统计数据。通过两种不同的实证设计(断点中的差分(difference-in discontinuities),交叠双重差分DID的局部投影法、连续DID等),利用HRS在各省市县逐步推行的情况,我们并未发现早期实施家庭联产承包责任制的地区经历了更快的粮食产量增长的因果关系。作者进一步探讨了可能影响识别的混淆变量,如其他政策的影响,溢出效应和边界效应,但这些因素并未对本文的识别结果产生影响。因此,本文的结果对我们对于取消集体化、土地改革以及中国经济奇迹起源的传统理解提出了挑战。如图6和7所示,HRS政策的影响都不显著,并且效应都接近于0。
中国的崛起不仅让数亿人脱离了贫困,也重新塑造了全球经济格局,成为世界各发展中国家追随的典范。据世界银行2022年的数据显示,自1980年以来,中国促进了全球75%的极端贫困减少和23%的全球GDP增长。因此,深入了解中国经济增长的原因已经成为增长和发展经济学中的核心议题。传统观点指出,中国经济的奇迹源自邓小平推行的市场化导向改革。首个也许最为重要的改革是1978年后推出的家庭联产承包责任制(HRS),它废除了Mao时代的集体农场模式,鼓励家庭按市场需求生产,实质上结束了农业中的communism。从1978年到1984年,官方粮食产量飙升了43%,从每公顷2.8吨增长到每公顷3.6吨。学界普遍认为HRS功不可没,林毅夫(1992)AER文章中的估计表明,1978年到1984年间,取消集体化对农业总产出增长贡献了49%。在农业仍占发展中国家核心地位的情况下(1980年农业增加值约占30%,就业占比约60%),提升生产力的措施使HRS成为中国经济起飞的主要推动因素。此外,HRS被视为成功,为其他改革的扩展铺平了道路,进一步实现了中国经济的自由化,成为Mao时代后*合法性的支柱。然而,我们究竟能对家庭联产承包责任制(HRS)的传统看法抱有多少信心呢?以往研究往往依赖于中国官方数据,却未充分利用现代因果推断技术的优势。相对于中国经济奇迹的壮举,对邓小平改革的当前研究异常稀缺,因为中国的经济统计数据要么不完备,要么不可靠。为了精确推断HRS的因果效应,我们需要更为详细的数据,但改革时期有关农业生产力的区域性数据却稀缺得令人担忧。并且,对China经济数据的可靠性存在着根本性的疑虑,外国研究人员、中国经济学家乃至中国高层领导都注意到,这些数据更多地反映了politics优先事项,而非真实情况。本文应对了这些挑战,并通过采用一种新颖的数据源——历史卫星图像,扩展了我们对中国经济奇迹原因的理解。本文的主要贡献在于创造了基于卫星的中国历史农业生产新指标。通过利用先进的高分辨率辐射计(AVHRR,the Advanced Very High Resolution Radiometer)图像,我们能够直接测量地面植被量,利用归一化植被指数(NDVI)这一常用的卫星测量方法,证明其中蕴含了所报道产量(产出与面积比值)的强有力信号。随后,为了将NDVI转化为可解释的产量,我们运用了遥感和环境科学的机器学习方法,对一组与中国相似作物和条件的国家进行了训练,预测其产量。接着,将这个训练好的模型应用于中国的遥感数据,形成了一个全新、高度细分的谷物产量数据集,它独立于官方数据。最后,我们通过一系列验证实验验证了这些基于卫星的指标能够准确预测产量。这篇论文的第二大贡献是将基于卫星数据的指标与中国HRS在不同时段实施的处理(treatment)数据相结合,为我们提供了关于HRS对粮食产量影响的首个可信因果估计。由于HRS最初只在偏远和饥荒地区得到允许实施,因果设计需要考虑受处理区域的选择。为解决这一问题,我们采用了两种独立的实证设计,充分利用卫星数据在时空上的独特细分性。首先,采用了一种断点中的差分(difference-in discontinuities)策略,利用了HRS在省级实施的分阶段特征。就像经典的断点回归设计RDD一样,我们确定了HRS在采用和未采用该制度的省份边界上的因果效应。此外,通过观察同一省份边界的变化,可以利用固定效应来控制任何不变的差异。在弱假设下,即在缺乏政策处理的情况下,边界两侧地区的趋势会保持平行,我们能够确定HRS的因果影响。其次,利用Almond等(2019)从历史年鉴中整理的县级改革分阶段数据,采用交叠双重差分法(staggered DID),发现HRS改革对预测产量的影响类似于零效应。本文的核心发现是家庭联产承包责任制对粮食产量影响微乎其微,接近于零效应。我们的断点中的差分估计非常精确,即使在改革开始三年后,也可以排除产量下降5%的影响,并且在各种估计方法及排除可能混淆因素的情况下都具有稳健性。本文未发现在采用HRS工作队比例更高的省份中存在更大的效应,此外,也未发现缺乏不连续性(存在断点)是由于混杂处理或向邻近地区的溢出效应造成的证据。同样地,我们利用完全独立的半官方数据源进行的县级HRS政策采用进行估计,也未发现县级层面较早采用HRS的地区经历了更快的产量增长。虽然我们的主要重点是家庭联产承包责任制对产量的因果效应,但作为额外的分析,还使用随机森林模型来预测中国各省的总体谷物产量。模型预测到,在1978年至1984年期间,总体产量确实有所增加。然而,HRS没有可检测到的因果效应,而持续的产量增长暗示,另一个改革,即1979年提高国家收购价格使其接近自由市场水平,可能是推动中国农业起飞的主要因素。我们的主要识别策略利用了中国各省HRS采纳的分阶段时间。主要处理变量来自林毅夫(1992)提供的省级数据。将一个省份编码为“接受处理”,如果该省份中采用HRS的工作队所占比例超过50%。图1展示了各省份何时达到并超过了这一采用HRS的门槛。1981年有11个省份超过了50%的门槛;1982年有9个省份;1983年有7个;最后一个省份在1984年达到。确定HRS因果效应的主要实证关注点在于选择:改革最初针对的是贫困、偏远或饥荒风险地区,1978年安徽开始进行的第一次取消集体化试验是为了应对干旱。换句话说,负向选择已经融入了改革的设计中:早期采用该制度的省份可能处境较差。这一关键特征未被早期基于省级面板回归估计的HRS效应所捕捉,比如林毅夫(1992),这种估计缺乏因果设计。这引发了一个担忧,即HRS只是捕捉到本质上更贫困地区的追赶效应。本文通过采用断点中的差分设计来解决这一问题,这种设计将边界断点回归(RDD)的逻辑扩展到多期情形中。在传统的边界RDD中,假设除了政策处理因素外的所有其他相关因素在边界上平稳变化,边界处观察到的结果不连续可以因果地归因于政策处理因素。天气事件(如1978年安徽的干旱)、气候和其他对农业有影响的自然特征可能在空间上是连续的,并满足省份边界的这一假设。然而,省界也反映了经济和政治上的差异,这些差异不太可能满足经典边界RDD假设的因果识别要求。断点中的差分设计使我们能够放宽这一假设。通过反复观察同一地理点随时间的变化,可以利用固定效应来控制边界上任何不变的断点。这一识别假设变成是,边界两侧的个体(unit)在潜在结果上呈现出平行趋势,类似于双重差分设计中的平行趋势假设。换句话说,我们可以控制边界处任何固定的差异(自然的、政治的或其他方面的),缓解选择方面的担忧;还可以通过随着时间观察边界断点的变化来确定HRS的影响,此时假设没有其他政策同时发生改变。
我们断点中的差分(difference-in-discontinuities)设计的一个潜在复杂因素是,当处理时间错开时,双向固定效应估计值可能存在偏差(Borusyak等,2023;Goodman-Bacon,2021;Sun和Abraham,2021),这个担忧适用于本文中HRS政策的推广。然而,即使存在阶段性政策处理,如果处理效应在各个队列中是均匀的,局部投影估计值(local projections estimator)仍将保持无偏性。我们认为在本文的设定中,鉴于发现了一个严格的零效应,这种假设是合理的。这个零效应在较短时间和较长时间内都保持不变,正如将在后面的县级双重差分设计中展示的那样。在附录表A6中作为稳健性检验,还采用了Dube等(2023)提出的“干净对照”局部投影方法(local projections apporach),比较限制在了未被处理的“干净对照组”单元边界的处理组省份。以这种方式限制样本会限制我们只观察改革后的一年(因为h = 1 需要两年时间,其中一个省份已经接受处理,而其邻居尚未)。然而,限制到干净对照组比较并没有改变结果。到目前为止,我们的估计依赖于家庭联产承包责任制(HRS)二值虚拟处理变量。我们应该如何思考家庭联产承包责任制份额增加的连续效应?那些家庭联产承包责任制份额更高的省份是否经历了更快的产量增长?为了衡量省份家庭联产承包责任制份额的连续变化对产量的影响(剂量-反应关系),我们可以通过将政策处理indicator, Di,b,t与HRSi,b,t的10%份额指示indicator进行交互来修改方程(3)。例如,如果家庭联产承包责任制份额介于50%-60%,60%-70%等之间。还有其他关于混淆因素的处理,可以具体到原文中查看。可以说该文属于用最新因果推断方法、机器学习和新数据的典范之作。Source:Joel Ferguson, Oliver Kim, 2023, Reassessing China’s Rural Reforms: The View from Outer Space,https://oliver_wkim.com/papers/oliver_kim_JMP.pdf
*社群群友可直接在社群下载全文PDF。
关于Top 5期刊,参考:1.JPE上19年以来10篇比较有意思且重要的文章”,2.机器学习方法出现在AER, JPE, QJE等顶刊上了!,3.中国内地学者过去30年发Top5刊的信息都在这里,4.AER史上最严关于论文数据和代码可得性政策,应对实证论文的复制性危机!5.五大Top经济刊物的在40年里发生了什么?6.最新研究, 没有Top5刊物, 劝你不要想终身教职! 7.Top期刊里不同来源内生性处理方法, 从此掌握少林绝学易筋经,8.经济学所有细分领域Top10大牛,不知晓他们我不好意思提创新,9.AER, AEJ上用准自然实验识别的实证文章有哪些?含程序和code, 不看至少需要收藏一下!10.AER和AEJ系列期刊最新一期, 有几篇关于中国的文章,11.机器学习方法出现在AER, JPE, QJE等顶刊上了!12.这个外国人拿中国数据发了多篇AER, JPE, RES等五大顶刊!汗颜!13.过去10年AER上关于中国主题的Articles专辑!14.使用OLS回归发AER的Articles专辑!15.AER, JHR主编告诉你, 如何在期刊上发论文,16.传销活动对经济发展影响, AER上截面数据分析经典文,17.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章,18.统计显著与经济显著, 发AER和经济研究的标配,19.与AER齐名的期刊主编亲笔信, 你需要这样来做计量实证研究,20.AER上以DID, DDD为识别策略的劳动和健康经济学,21.一个使用截面数据的政策评估方法, 也可以发AER,22.机制分析做到极致的JPE趣文, 身高与收入,23.QJE上处理内生性问题的必读作品细致解读, 非洲奴隶贸易的长远影响,24.从QJE的引用率事实,我们如何看出了经济文章价值?25.结果不显著但成功发在Top期刊上的论文有哪些?你心虚过没?26.男神毛咕噜最新Top5大作, 另外, 有序因变量依然使用OLS回归! 27.金融Top刊JOF近20万大奖, 有哪些论文获得了?28.2020年中文Top期刊重点选题方向, 写论文就写这些,29.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险!30.发表Top5刊的500强名单出炉, 这几位中国人实至名归等等。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。